Protein

Browse of TCMCG075C10084 protein

CDS


Accession Number	TCMCG075C10084
gbkey	CDS
Protein Id	XP_007038668.2
Location	complement(join(28676700..28676703,28676897..28677213,28677353..28677823,28678079..28678228,28679026..28679097,28679180..28679440,28679576..28679707,28679814..28680077,28680464..28680715,28680808..28680906,28681444..28681608,28681917..28682102,28682694..28683668))
Gene	LOC18605549
GeneID	18605549
Organism	Theobroma cacao

Protein


Length	1115aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA341501
db_source	XM_007038606.2
Definition	PREDICTED: DNA mismatch repair protein MSH3 [Theobroma cacao]

EGGNOG-MAPPER Annotation


COG_category	L
Description	DNA mismatch repair
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko00001 [VIEW IN KEGG] ko03400 [VIEW IN KEGG]
KEGG_ko	ko:K08736 [VIEW IN KEGG]
EC	-
KEGG_Pathway	ko01524 [VIEW IN KEGG] ko03430 [VIEW IN KEGG] ko05200 [VIEW IN KEGG] ko05210 [VIEW IN KEGG] map01524 [VIEW IN KEGG] map03430 [VIEW IN KEGG] map05200 [VIEW IN KEGG] map05210 [VIEW IN KEGG]
GOs	GO:0000217 [VIEW IN EMBL-EBI] GO:0000404 [VIEW IN EMBL-EBI] GO:0003674 [VIEW IN EMBL-EBI] GO:0003676 [VIEW IN EMBL-EBI] GO:0003677 [VIEW IN EMBL-EBI] GO:0003684 [VIEW IN EMBL-EBI] GO:0003690 [VIEW IN EMBL-EBI] GO:0003824 [VIEW IN EMBL-EBI] GO:0005488 [VIEW IN EMBL-EBI] GO:0005575 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0006139 [VIEW IN EMBL-EBI] GO:0006259 [VIEW IN EMBL-EBI] GO:0006281 [VIEW IN EMBL-EBI] GO:0006298 [VIEW IN EMBL-EBI] GO:0006725 [VIEW IN EMBL-EBI] GO:0006807 [VIEW IN EMBL-EBI] GO:0006950 [VIEW IN EMBL-EBI] GO:0006974 [VIEW IN EMBL-EBI] GO:0006996 [VIEW IN EMBL-EBI] GO:0008094 [VIEW IN EMBL-EBI] GO:0008150 [VIEW IN EMBL-EBI] GO:0008152 [VIEW IN EMBL-EBI] GO:0009987 [VIEW IN EMBL-EBI] GO:0016043 [VIEW IN EMBL-EBI] GO:0016462 [VIEW IN EMBL-EBI] GO:0016787 [VIEW IN EMBL-EBI] GO:0016817 [VIEW IN EMBL-EBI] GO:0016818 [VIEW IN EMBL-EBI] GO:0016887 [VIEW IN EMBL-EBI] GO:0017111 [VIEW IN EMBL-EBI] GO:0030983 [VIEW IN EMBL-EBI] GO:0032135 [VIEW IN EMBL-EBI] GO:0032300 [VIEW IN EMBL-EBI] GO:0032991 [VIEW IN EMBL-EBI] GO:0033554 [VIEW IN EMBL-EBI] GO:0034641 [VIEW IN EMBL-EBI] GO:0042623 [VIEW IN EMBL-EBI] GO:0043170 [VIEW IN EMBL-EBI] GO:0043570 [VIEW IN EMBL-EBI] GO:0044237 [VIEW IN EMBL-EBI] GO:0044238 [VIEW IN EMBL-EBI] GO:0044260 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI] GO:0046483 [VIEW IN EMBL-EBI] GO:0050896 [VIEW IN EMBL-EBI] GO:0051276 [VIEW IN EMBL-EBI] GO:0051716 [VIEW IN EMBL-EBI] GO:0071704 [VIEW IN EMBL-EBI] GO:0071840 [VIEW IN EMBL-EBI] GO:0090304 [VIEW IN EMBL-EBI] GO:0097159 [VIEW IN EMBL-EBI] GO:1901360 [VIEW IN EMBL-EBI] GO:1901363 [VIEW IN EMBL-EBI] GO:1990391 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGGGGAAGCAAAAGCAACAAGTCATTTCTCGTTTTTTTGCCCCCAAACCCAAAACCCCATCCACCCCAACTCCACCAGCAAACCCTTCATCTTCTCCGTCTCCTCCTTCACCGCCAATCCCATCACCCAACGTAAAAGCAACTGTCTCTTTTTCCCCTTCAAAGCGCAAACTCCTCTCAACCCACCTCACTTCCACTCCTAAGAAACCCAAAACCACGCTTTCACCTCACACCCACAACCCCGTTCCTCTTCAGTCTAATCCTTCCCTCCACCAAAAATTCCTCCACAAACTTCTGGAACCTTCTCCACGACGTCCGCTTGAACCTACCGTCGAACTTTCCGGATCCGACCACAAAAAGTACACCCCACTAGAACAACAAGTGGTGGATTTAAAAAACAAATACCCGGATGTTCTTCTCATGGTGGAAGTCGGTTACAGGTTCCGATTCTTCGGGAAGGATGCGGAAATCGCGGCGAAAGAGTTGGGAATATATGCCCACGTGGACCGCAACTTCTTAACGGCTAGCGTACCTACTTTTCGACTGAATGTCCACGTGAGGAGGCTGGTCAGTGCGGGATACAAGGTTGGTGTGGTGAAACAGACAGAAACGGCGGCGATTAAGGCGCATGGTTCGAACCGAGTTGGACCGTTTTGCAGGGGTTTGTCGGCATTATACACGAAGGCTACGCTGGAGGCCGCGGAGGATGTGGGAGGGAAAGAGGAAGGGTGTGGTGGAGAGAGTAATTATTTGGTTTGCGTTGTGGAGAAAGGTTTGGAGTTTTCGGGGTCTGTTTCAGGTTCTGGTGCGGTTGATGTGAGGGTTGGAATTGTTGGAGTGGAGATTTCAACGGGGGATGTTGTTTATGGGGAGTTTGATGATGGAGTTATGAGGAGCGGGCTTGAAGCTGTGGTTTTTAGCTTGGCTCCCGCTGAGTTATTGGTTGGAGAACCGCTTTCGAAACAAACAGAAAAGTTGTTATTGGCATATGCTGGACCTGCTTCAAATGTTCGTCTGGAGCATGCCTCTTGTGATTGTTTCAAGGGTGGTGGCGCACTTGCGGAAGTGATGTCTGTGTATGAGAAGATGGTTGAAGATAATTTAGCCAGTAATGTGAATCAGTCATTGGAGGCAACAGAATATTCTCACTCTTCAATTCAGGGGGTTATGAACATGCCAGATTTGGCTTTACAAGCTTTGGCCTTAACCATTCGTCATCTCAAGCAATTTGGATTTGAAAGAATTGTGTGCCTTGAAGCTTCATTTCGTTCCTTATCAAGCAGTTTGGAGATGAATCTTTCAGCAAATACACTTCAACAATTAGAGATTTTGAGGAATAATTCAGATGGGTCTGAATCTGGCTCCTTGCTGCAAATTATGAACCATACTCTTACTATTTATGGATCAAGGCTTCTTAGACACTGGGTGACTCATCCTTTATGTGATAGAACCATGATATCTGCTCGACTTGATGCTGTTTCTGAAATTGCTTTGTCCATGGGGTGTTATAAAGTCTCACAAAGTATCATTGAGATAGATGGGGAAGATTCTGATGTGACCATTGCACAACCAGAATTCTACTCTGTGCTTTCCTCAGTTTTAACTTTTTTAGGAAGATCACCTGATATTCAGCGTGGAATAACAAGAATCTTCCATCGAACTGCCACCCCAGCAGAGTTCATTGCAGTTATTCAAGCTATTTTATCTGCTGGAAAGCAACTTCAGCGGCTTCATATTGATGAAGAACATGAAGACAATTGCAGTAAGAAAGTGCGAGTAGGGATTGTGCAGTCAGCTCTGTTGAAAAGGTTGATTTTGACTGCTTCATCATCCAATGTTCTTGGCAATGCTGCAAAACTGCTATCTTTCCTAAACAAAGAAGCAGCTGATAAAGGGGATTTAACAAACTTAATCATCATTTCTAACAACCAATTTCCGGAGGTTGCTAGAGCTAGGAAAGCAGTTCAATTGGCGAAGGAGAAACTGGATAACTTGATTTTCTTGTATAGAAAGCGACTTGGGAAAGGCAATTTGGAATTTATGTGTGTGTCAGGAACCACACATTTGATAGAGCTACCCATAGATGCCAATGTACCTTCAAACTGGGTTAAGGTAAATAGTACCAAAAAGACAATAAGGTATCATCCGCCTGAAGTATTGACTGCTCTAGACCAGTTAACACTGGCAAATGAAGAGCTCACCATTATCTGTCGAGCTGCTTGGGACAGCTTTCTTAGGGAATTTGGTGAATATTACTCCGAGTTTCAAGCTGCTGTTCAAGCACTTGCTGCTTTGGACTGTTTGCACTCTCTTGCCACTCTCTCAAGAAATAAGAATTATGTTCGGCCTATCTTTGTGGATGACAATGAACCTGTTCAGATACAAATCCACTCCGGTCGTCACCCTGTGTTGGAGACCATCTTACAAGAGGGTTTTGTTCCAAATGACACAACATTGCATGCAGACAGGGAGTGTTGTCAGATTGTTACTGGTCCTAATATGGGTGGAAAGAGTTGCTACATTCGCCAGGTTGCACTAATTGCAATGATGGCTCAGGTTGGTTCCTTTGTACCAGCAGCATCAGCTACTTTGCATGTGTTAGATGCTATCTACACACGCATGGGTGCTTCTGACAGTATACAACAAGGGAGAAGTACATTTCTAGAAGAACTAAGTGAGGCTTCTCAAATACTCCACAGCTGCACAGCACGCTCACTGGTTGTAATTGATGAGCTTGGAAGAGGAACTAGTACACATGATGGTGTATCTATTGCTTATGCTACATTACATCATCTGTTGGAGCAGAGAAAATGCATGGTCCTCTTTGTAACCCACTACCCTAGAATTGCTGATATTAAAGTTGAATTTCCTGGTTCTGTGGAGGTATATCATGTTTCATATCTGACTGCACATAATGATGAGGTTACTATGGATGCAAAATCTGATCATGAAGTCACGTACCTATATAAGCTTGTTCCTGGTGTTTCTGCAAGGAGTTTTGGATTCAAGGTTGCACAGCTTGCCCAGCTGCCTTCATCATGCATCAGTCAAGCAATTATCATGGCTACAAGGCTGGAAGCAATTGAAAGCAGCAGAGTGAGAAAGAAATCAGAAGAAAGGCAGCCAGAAACATCATCGAGTGATCAAGAACTAGAAACACAAGAGAACATACTGAAATCCATTGGTAGCTTCTCCAGTGAAAGGCTAGAGAATTTAGAAGAATTTGCCAGTGCTTTCAGTGACTTGCTTTTGAACTTGAAATCTGCAAGAACGGATGATGACCTTGGCAAAAGCTTTCAGTTATTGAAAGAGGCTAGAAGCATTGCAAAGGAATTGATAAACAGATAA

Protein:
MGKQKQQVISRFFAPKPKTPSTPTPPANPSSSPSPPSPPIPSPNVKATVSFSPSKRKLLSTHLTSTPKKPKTTLSPHTHNPVPLQSNPSLHQKFLHKLLEPSPRRPLEPTVELSGSDHKKYTPLEQQVVDLKNKYPDVLLMVEVGYRFRFFGKDAEIAAKELGIYAHVDRNFLTASVPTFRLNVHVRRLVSAGYKVGVVKQTETAAIKAHGSNRVGPFCRGLSALYTKATLEAAEDVGGKEEGCGGESNYLVCVVEKGLEFSGSVSGSGAVDVRVGIVGVEISTGDVVYGEFDDGVMRSGLEAVVFSLAPAELLVGEPLSKQTEKLLLAYAGPASNVRLEHASCDCFKGGGALAEVMSVYEKMVEDNLASNVNQSLEATEYSHSSIQGVMNMPDLALQALALTIRHLKQFGFERIVCLEASFRSLSSSLEMNLSANTLQQLEILRNNSDGSESGSLLQIMNHTLTIYGSRLLRHWVTHPLCDRTMISARLDAVSEIALSMGCYKVSQSIIEIDGEDSDVTIAQPEFYSVLSSVLTFLGRSPDIQRGITRIFHRTATPAEFIAVIQAILSAGKQLQRLHIDEEHEDNCSKKVRVGIVQSALLKRLILTASSSNVLGNAAKLLSFLNKEAADKGDLTNLIIISNNQFPEVARARKAVQLAKEKLDNLIFLYRKRLGKGNLEFMCVSGTTHLIELPIDANVPSNWVKVNSTKKTIRYHPPEVLTALDQLTLANEELTIICRAAWDSFLREFGEYYSEFQAAVQALAALDCLHSLATLSRNKNYVRPIFVDDNEPVQIQIHSGRHPVLETILQEGFVPNDTTLHADRECCQIVTGPNMGGKSCYIRQVALIAMMAQVGSFVPAASATLHVLDAIYTRMGASDSIQQGRSTFLEELSEASQILHSCTARSLVVIDELGRGTSTHDGVSIAYATLHHLLEQRKCMVLFVTHYPRIADIKVEFPGSVEVYHVSYLTAHNDEVTMDAKSDHEVTYLYKLVPGVSARSFGFKVAQLAQLPSSCISQAIIMATRLEAIESSRVRKKSEERQPETSSSDQELETQENILKSIGSFSSERLENLEEFASAFSDLLLNLKSARTDDDLGKSFQLLKEARSIAKELINR

Browse of TCMCG075C10084 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence